#optimización multi-turno

DRIFT: Optimización eficiente de modelos de lenguaje en múltiples turnos

DRIFT optimiza modelos de lenguaje en múltiples turnos con eficiencia de SFT y rendimiento de RL. Descubre cómo.